Expectation Maximization, EM

혼합 분포 군집
EM 알고리즘(Expectation Maximization)
확률모델의 최대가능도(Maximumu Likelihood)를 갖는 모수와 함께 그 확률모델의 가중치를 추정
install.packages(‘mixtools’)

> library(mixtools)

mixtools package, version 1.2.0, Released 2020-02-05

This package is based upon work supported by the National Science Foundation under Grant No. SES-0518772.


# 미국의 온천 분출 시간 자료 faithful의 waiting 열

> waiting<-faithful$waiting

> hist(waiting)

두 개의 정규분포가 혼합된 것으로 유추할 수 있다.
normalmixEM을 사용하여 분포 군집을 수행

> result<-normalmixEM(waiting)

number of iterations= 21 

> summary(result)

summary of normalmixEM object:

          comp 1    comp 2

lambda  0.360887  0.639113

mu     54.614892 80.091092

sigma   5.871245  5.867716

loglik at estimate:  -1034.002 


# 분포 1은 평균이 54.71, 표준편차가 5.87인 정규분포를 따르며, 약 36%의 비중을 가진다.

# 분포 2은 평균이 80.09, 표준편차가 5.87인 정규분포를 따르며, 약 64%의 비중을 가진다.